AI资讯新闻榜单内容搜索-Claude Opu

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Claude Opu
狂奔AGI,Claude年终封王!自主编码近5小时震惊全网

狂奔AGI,Claude年终封王!自主编码近5小时震惊全网

狂奔AGI,Claude年终封王!自主编码近5小时震惊全网

2025年就要结束了,原来真正的高手,隐藏在「民间」!不是谷歌、不是OpenAI,是Anthropic王者编程模型Claude Opus 4.5。在METR最新公布报告称,Claude Opus 4.5已能够持续自主编码「长达5小时不崩」。

来自主题: AI资讯
7686 点击    2025-12-21 13:51
Claude Opus 4.5 的灵魂文档被人逆向提取!Anthropic 负责人承认属实

Claude Opus 4.5 的灵魂文档被人逆向提取!Anthropic 负责人承认属实

Claude Opus 4.5 的灵魂文档被人逆向提取!Anthropic 负责人承认属实

家人们,大瓜! 国外有位叫 Richard Weiss 的开发者花了 70 美元,把 Claude 4.5 Opus 给——审!讯!了!而且审出了 Claude 的人生观、世界观、价值观,足足 1.4 万 token。

来自主题: AI资讯
7664 点击    2025-12-03 20:00
终结OpenAI垄断的11人

终结OpenAI垄断的11人

终结OpenAI垄断的11人

估值飙升至3500亿美元,Claude Opus 4.5强势登顶企业级市场,Anthropic正式终结了OpenAI的独角戏时代。从Instagram创始人到OpenAI的「决裂者」,这11位顶尖人物组成了硅谷最豪华的「复仇者联盟」。他们用一场惊天逆袭证明,在通往AGI的狂飙突进中,对安全的极致坚守才是最深的护城河。

来自主题: AI资讯
7375 点击    2025-12-01 10:43
深度讨论 Gemini 3 :Google 王者回归,LLM 新一轮排位赛猜想|Best Ideas

深度讨论 Gemini 3 :Google 王者回归,LLM 新一轮排位赛猜想|Best Ideas

深度讨论 Gemini 3 :Google 王者回归,LLM 新一轮排位赛猜想|Best Ideas

最近两周的模型竞赛非常热闹:OpenAI 在 11 月 12 日发布 GPT-5.1,引入更强的推理深度与更高效的对话体验;Google 在 11 月 18 日发布 Gemini 3,全面强化多模态理解与复杂推理能力;Anthropic 在 11 月 24 日又发布了 Claude Opus 4.5,模型在专业文档处理、代码生成与长流程 agent 方面有显著提升。

来自主题: AI资讯
7563 点击    2025-11-28 09:27
Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

刚刚,Claude Opus 4.5问世,主打编码、Agent与computer use。Opus 4.5在前端开发、视觉能力上显著提升,更擅长使用电脑。在深度研究、PPT制作与电子表格处理等日常任务方面的表现也全面升级。

来自主题: AI资讯
9438 点击    2025-11-25 11:00
突发!Claude Opus 4.5编程世界第一,把谷歌OpenAI踢下王座

突发!Claude Opus 4.5编程世界第一,把谷歌OpenAI踢下王座

突发!Claude Opus 4.5编程世界第一,把谷歌OpenAI踢下王座

全球编码王座,一夜易主。深夜,Claude Opus 4.5重磅出世,编程实力暴击Gemini 3 Pro、GPT-5.1。才一周的时间,AI圈就完成了一次闭环式迭代。它不仅编程强,而且智能体和计算机使用(computer use)能力也是一流。

来自主题: AI资讯
10579 点击    2025-11-25 08:43
GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍

GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍

GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍

Scale AI的新软件工程基准SWE-BENCH PRO,出现反转!表面上看,“御三家”集体翻车,没一家的解决率超过25%: GPT-5、Claude Opus 4.1、Gemini 2.5分别以23.3%、22.7%、13.5%的解决率“荣”登前三。

来自主题: AI技术研报
10195 点击    2025-09-22 16:11
「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?

「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?

「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?

一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。

来自主题: AI资讯
8684 点击    2025-08-27 18:09
刚刚,大模型棋王诞生!40轮血战,OpenAI o3豪夺第一,人类大师地位不保?

刚刚,大模型棋王诞生!40轮血战,OpenAI o3豪夺第一,人类大师地位不保?

刚刚,大模型棋王诞生!40轮血战,OpenAI o3豪夺第一,人类大师地位不保?

继Kaggle Game Arena的淘汰赛后,国际象棋积分赛成果出炉!OpenAI o3以人类等效Elo 1685分傲视群雄,而Grok 4和Gemini 2.5 Pro紧随其后。DeepSeek R1和GPT-4.1、Claude Sonnet-4、Claude Opus-4并列第五。

来自主题: AI资讯
7323 点击    2025-08-23 13:17
GPT-5 vs Claude Opus 4.1:编程能力测评

GPT-5 vs Claude Opus 4.1:编程能力测评

GPT-5 vs Claude Opus 4.1:编程能力测评

OpenAI 发布了 GPT-5,我在公众号里、社群里、论坛里,很多地方都在刷屏一个消息:GPT-5 来了,而且在编程能力上“强得可怕”。

来自主题: AI产品测评
8721 点击    2025-08-12 16:52